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孤独 症 谱系 障碍 者 的 视听 时 间 整 合 
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( 辽宁 师范 大 学 心理 学 院 ,大 连 116029) (大连 医科 大 学 基础 医学 院 ， 大 连 116044) 


摘 要 视听 时 间 整 合 是 指 个 体 对 一 定时 间 间 隔 内 输入 的 视听 刺激 进行 表征 的 过 程 ， 是 视听 整合 的 重要 机 
制 。 孤 独 症 谱系 障碍 者 的 视听 时 间 整 合 存在 缺陷 ,主要 表现 为 4 个 方面 : 视听 时 间 整 合 窗口 较 正 常 个 体 更 宽 、 
更 对 称 ; 快速 视听 时 间 再 校准 能 力 不 足 ; 听觉 时 间 线 索 对 其 视觉 搜索 促进 作用 弱 ; 言语 刺激 的 视听 时 序 知觉 
敏感 性 低 。 目 前 使 用 的 研究 任务 多 样 ， 如 声音 诱发 闪光 错觉 和 “pip-pop" 任 务 从 内 隐 和 角度 探究 视听 整合 中 的 时 
间 机 制 ， 同 时 性 判断 、 时 序 判 断 和 优先 注视 任务 主要 用 于 跨 通道 时 序 知觉 的 研究 。 相 关 理 论 从 神经 加 工 异 常 、 
先 验 经 验 不 足 和 视听 通道 的 相互 作用 等 角度 解释 了 其 缺陷 。 未 来 需要 进一步 提高 研究 生态 效 度 ， 整 合理 论 解 
释 ， 精 确 量 化 诊断 指标 ， 同 时 开发 有 实效 的 干预 策略 。 
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1 引 
个 体 对 外 界 事物 的 感知 依赖 于 多 感觉 通道 信 


息 的 整合 ,例如 ,在 言语 交流 时 , 需要 整合 谈话 者 
的 表情 、 手 势 和 声音 等 信息 。 视 听 时 间 整 合 
(audiovisual temporal integration) 是 个 体 对 一 定时 
间 间 隔 内 输入 的 视听 刺激 进行 表征 的 过 程 ， 即 对 
时 间 上 不 同步 的 刺激 进行 再 加 工 , 将 其 整合 为 一 
个 有 意义 的 独立 事件 (Stevenson，Fister，Barnett， 
Nidiffer, & Wallace, 2012; Stevenson & Wallace, 2013). 
a hal ay Et FFI A 7 : 
整合 的 时 间 窗 口 模型 (Time-Window-of-Integration) resonance imaging,fMRD 的 研究 表明 ,视听 情绪 


认为 , 视觉、 听觉 和 触觉 等 感觉 线索 是 并 行 输入 re 
ee ee 诗 息 整合 时 ， 控 制 组 会 激活 额 里 叶 相 关 皮 质 区 ， 


的 ， 其 加 工 过 程 及 所 用 加 工时 间 彼 此 独立 , 一 旦 S 
2. BE TH A 2 í 
某 个 通道 的 刺激 完成 加 工 ， 整 合 窗口 便 会 开启 ， 而 ASD 者 更 多 激活 顶 额 网 络 (Doyle-Thomas， 


i“ TA ldberg, Szatmari, & Hall, 2013)， 关 于 视听 语 》 
1 果 其 他 通道 的 信息 输入 也 在 该 窗口 内 终止 , 多 Goldberg, Szatmari, & Hall, 2013); 2S THUA X 
ps Nice shh aps ee 整合 时 间 进 程 的 研究 表明 ， 在 时 间 窗 为 200~300 
感觉 整合 就 会 发 生 (Colonius & Diederich, 2004)。 ~ anaes 、 
pae 日 l : ms 时， 听觉 会 促进 视觉 层 动 加 工 ， 而 ASD 者 在 该 
孤独 症 谱系 障碍 (Autism Spectrum Disorders, a ; 
ASD) 是 一 组 广泛 性 神经 发 育 障碍 ,感知 觉 异 常 是 时 段 内 两 者 间 的 调节 作用 不 明显 (Megnin et al., 
2012)。 同 样 , 行为 研究 结果 表明 ,ASD 者 在 整合 
视听 、 视 触 和 听 触 等 信息 时 均 存在 缺陷 ， 主 要 表 
现 为 对 复杂 的 社会 性 刺激 难以 整合 (Baum， 
Stevenson, & Wallace, 2015; Greenfield, Ropar, Smith, 


Lilt 


其 症状 的 主要 方面 并 已 作为 核心 诊断 标准 纳入 
了 美国 精神 障碍 诊断 统计 手册 第 五 版 (DSM-V) 
(American Psychiatric Association, 2013)。 早 期 对 
ASD 者 感知 觉 缺 陷 的 研究 多 关注 单 通道 信息 加 工 
的 异常 。 例 如 ,ASD 者 对 音 高 、 音 强 等 低级 声学 
线索 过 度 敏感 ， 会 出 现 听 觉 解 码 偏差 (0’Connor, 
2012)。 近 年 来 ， 跨 通道 感觉 的 加 工 模式 则 倍 受 关 
TE, 神经 生理 学 的 研究 发 现 ASD 者 在 进行 视听 
整合 时 与 正常 个 体 的 神经 激活 模式 存在 差异 ， 如 
关 功 能 性 磁 共 振 成 像 (functional magnetic 


m 


Ezy 


收 稿 日 期 : 2017-04-06 
* 辽宁 省 特聘 教授 基金 .辽宁 省 人 文 社 科 重 点 研究 基地 
项 目 和 辽宁 省 儿童 青少年 健康 人 格 评定 与 培养 协同 


创新 中 心 资助 项 目 支持 Carey, & Newport, 2015; Russo et al., 2010)。 根 据 
通信 作者 : 胡 金 生 , E-mail: hu jinsheng@126.com 弱 中 央 统 合 (weak central coherence) 理 论 ,“ 统 合 ” 


1031 


1032 心理 科学 进展 第 26 卷 


需要 将 信息 整合 到 相关 的 情境 中 来 完成 更 高 水 平 
的 心理 完 形 ， 该 过 程 不 仅 需 要 注意 资源 的 投入 ， 
也 依赖 于 对 信息 时 空 特性 的 把 握 ， 跨 通道 刺激 间 
时 间 线 索 加 工 的 低 敏 感性 是 整合 加 工 缺 陷 产 生 的 
重要 原因 (Glessner et al., 2009; Stevenson, Zemtsov, 
& Wallace, 2012). 

ASD 者 视听 时 间 整 合 的 研究 可 以 进一步 探 明 
其 跨 通道 整合 加 工 缺 陷 的 形成 机 制 ， 相 关 研 究 有 
利于 超越 其 感知 觉 缺 陷 表 型 的 多 维 性 ， 为 揭示 其 
病因 的 复杂 性 和 相通 性 提供 理论 基础 。 例 如 , 
间 窗 口 作为 视听 时 间 整 合 的 重要 衡量 指标 能够 
直观 反映 ASD 者 和 正常 被 试 在 短 时 间 内 对 视听 
刺激 的 整合 加 工 模式 差异 。 研 究 表 明 ,，ASD 者 时 
间 整 合 窗口 比 正常 人 宽 , 同等 条 件 下 ,该 群体 对 
跨 通 道 感觉 刺激 输入 的 时 间 估 计 存 在 偏差 . 分离 
异步 性 刺激 的 能 力 较 弱 (Wallace & Stevenson, 
2014)。 另 外 ， 明 确 该 群体 视听 整合 的 时 间 关 系 ， 
不 仅 有 利于 在 后 续 的 行为 和 知觉 训练 中 对 感知 刺 
激 的 时 间 知 觉 进行 精准 干预 ,还 有 利于 说 明 ASD 
者 言语 障碍 、 社 交 缺 陷 等 核心 症状 的 形成 机 制 。 
例如 ， 层 动 和 声音 线索 之 间 的 时 间 同 步 性 是 视听 
言语 整合 的 关键 , ASD 者 对 视听 同步 性 辨别 敏感 
性 的 降低 会 导致 其 言语 接受 能 力 减弱 (Patten, 
Watson, & Baranek, 2014)。 


2 孤独 症 者 视听 时 间 整 合 的 研究 方法 


2.1 声音 诱发 内 光 错 党 任务 

声音 诱发 闪光 错觉 任务 (sound-induced flash 
illusion task) 主 要 从 内 隐 的 角度 探讨 ASD 者 的 视 
听 时 间 整 合 。 在 该 任务 中 ,呈现 一 个 闪光 和 两 个 
声音 ， 其 中 一 个 声音 与 内 光 同 时 呈现 ， 另 一 个 声 
音 与 闪光 不 同时 呈现 。 要 求 被 试 忽略 听觉 刺激 ， 
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垂直 的 线条 为 靶 刺 激 , 在 靶 刺 激 颜 色 变化 的 同时 
呈现 一 个 声音 。 要 求 被 试 搜索 靶 刺 激 ， 并 记录 其 
搜索 的 正确 率 和 反应 时 。 该 任务 用 于 探讨 视听 整 
合 中 时 间 加 工 机 制 的 原理 是 : 视觉 搜索 中 ,在 一 
定 的 时 间 内 呈现 声音 时 可 以 促进 搜索 效率 的 提高 ， 
即 产生 “pop-out”" 效 应 。 当 视听 刺激 间 的 时 间 知 觉 
能 力 减 弱 时 ， 该 效应 会 随 之 减弱 (van der Burg, 
Olivers, Bronkhorst, & Theeuwes, 2008; Collignon 
et al., 2013)。 该 任务 从 一 个 新 的 角度 对 ASD 者 的 
视听 时 间 整 合 进行 了 研究 , 但 需要 被 试 进行 按键 
反应 ,因此 只 适用 于 高 功能 ASD 个 体 。 另 外 , K 
验 要 求 记录 反应 时 ,而 ASD 者 普遍 存在 注意 缺 陶 ， 
因此 其 可 靠 性 还 需 进 一 步 提 高 。 

2.3 ”同时 性 判断 任务 

同时 性 判断 任务 (simultaneity judgment task, 
SD) 主 要 用 于 检测 ASD 者 视听 时 间 同 步 性 辨别 能 
力 。 在 该 任务 中 ， 先 呈现 视觉 或 听觉 通道 刺激 ,一 
个 时 间 间 隔 (stimulus onset asynchrony，SOA) 后 ， 
再 呈现 另 一 通道 的 刺激 。 要 求 被 试 判 断 两 者 是 否 
同时 出 现 。 通 过 操控 SOA 来 测量 同步 性 知觉 敏感 
性 , 研究 中 根据 需要 可 设置 不 同 的 SOA, 一 般 非 
言语 刺激 为 0~300 ms, 言语 刺激 为 0~400 ms 
(Stevenson, Siemann, Schneider et al., 2014)。 根 据 
正确 率 和 SOA (EWA KA, 得 到 时 间 窗 和 主观 同 
时 点 (Baum et al., 2015)。 该 任务 设计 巧妙 ， 易 于 操 
E， 但 需要 被 试听 懂 指 导语 并 按键 反应 ， 因 此 只 


出 


存在 言语 理解 障碍 , 在 研究 中 是 否 听 懂 指导 语 
还 需 谨慎 确认 。 
2.4 ”时 序 判 断 任务 

时 序 判 断 任务 (temporal order judgment task, 
TOJ) 是 用 于 测量 时 序 辨 别 敏感 性 的 方法 ， 依 据 反 


报告 看 到 的 闪光 数量 (Foss-Feig et al., 2010)。 在 此 
过 程 中 ， 闪 光 和 声音 之 间 的 时 间 关 系 会 对 闪光 数 
量 的 知觉 产生 影响 ， 当 时 间 间 隔 变 小 或 者 对 其 时 
间 关 系 的 知觉 能 力 降低 时 ， 闪光 数量 知觉 的 错误 
率 会 增加 (Shams, Kamitani, & Shimojo, 2002)。 该 
任务 主要 使 用 非 言 语 刺激 进行 研究 ,实验 中 同时 
呈现 视听 刺激 ， 这 与 现实 生活 很 相符 ， 因 此 具有 
较 高 的 生态 效 度 。 
2.2 “pip-pop” 任 务 

“pip-pop” 任 务 是 通过 呈现 一 系列 方向 不 同 、 
旦 在 两 种 颜色 间 随 机 变化 的 短线 条 ， 其 中 水 平 或 


应 通道 的 不 同 ,可 分 为 视觉 、 听 觉 和 多 感觉 TOT 
任务 , 视听 时 间 整 合 的 研究 通常 使 用 多 感觉 TOJ 
任务 。 该 任务 的 操作 方法 和 SJ 任务 基本 相同 , 但 
要 求 被 试 判 断 的 是 哪个 刺激 先 出 现 。 实 验 中 , 一 
般 视觉 先 于 听觉 刺激 (visual preceding auditory, 
VA) 和 听觉 先 于 视觉 刺激 (auditory preceding 
visual, AV) 呈 现 的 概率 各 占 50%。 时 序 知觉 的 敏感 
性 通常 根据 主观 同时 点 和 最 小 可 觉 差 just 
noticeable differences, JND) Æ f Œ (de Boer- 
Schellekens, Eussen, & Vroomen, 2013; Kwakye, 
Foss-Feig, Cascio, Stone, & Wallace, 2011)。 相 比 上 
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文 提 到 的 同时 性 判断 任务 ,该 任务 较 少 受 反 应 偏 
差 的 影响 ,精准 性 更 好 , 但 需要 投入 更 多 地 认 知 
ME, 对 被 试 也 更 具 挑 战 性 (Binder 2015; Vroomen 
& Keetels, 2010)。 
2.5 ”优先 注视 任务 

优先 注视 任务 (preferential-looking task) 是 基 
于 眼 动 技术 提出 的 ， 主 要 用 于 检验 ASD 者 对 言语 
刺激 的 时 间 同 步 性 知觉 。 在 该 任务 中 ， 呈 现 两 个 
不 同步 但 内 容 相同 的 视频 ， 同 时 通过 耳机 播放 与 
视频 相 匹 配 的 声音 , 它 只 与 其 中 一 个 视频 保持 同 
步 。 其 原理 为 : 当 视 听信 息 之 间 存 在 固定 的 时 间 
关系 时 ， 听 觉 信息 会 影响 视觉 的 注视 模式 。 当 声 
音 的 呈现 和 两 个 视频 的 同步 性 随机 匹配 时 ， 被 试 
对 每 个 视频 的 注视 时 间 应 分 别 为 50%; 而 当 声 音 
时 现 与 视频 之 间 的 时 间 关 系 固定 时 , 个 体 对 视听 
同步 呈现 视频 的 注视 时 间 会 更 长 (Bebko，Weiss， 
Demark, & Gomez, 2006; Grossman, Steinhart, 
Mitchell, & Mcllvane, 2015)。 该 任务 指导 语 简单 ， 
对 被 试 的 言语 和 认 知 能 力 要 求 较 低 ， 而 且 不 需要 
被 试 按键 反应 ,数据 搜集 方式 无 干扰 ， 实验 过 程 
趣味 性 较 强 , 适用 于 幼儿 和 低 功 能 被 试 。 

从 上 文 的 研究 方法 可 以 看 出 ，ASD 者 视听 时 
间 整 合 的 研究 任务 多 样 ,测量 角度 颇 为 丰富 。 声 
音 诱发 闪光 错觉 和 “pip-pop” 任 务 主 要 从 内 隐 人 角度 
探讨 视听 整合 中 ,听觉 对 视觉 加 工 直接 调节 作用 
的 时 间 点 和 时 间 范 围 ; 优先 注视 任务 测量 ASD 和 
正常 被 试 在 视听 同步 性 知觉 中 的 眼 动 加 工 差异 ; 
SJ 和 TOJ 任 务 从 外 显 角度 测量 跨 通道 时 序 知觉 的 
敏感 性 ， 任 务 中 的 主要 变量 为 刺激 呈现 的 同步 和 
异步 ， 前 者 只 需 知 觉 时 间 顺 序 , 后 者 还 需 辨 别 顺 
序 的 先后 ， 因 此 需要 更 多 的 心理 加 工 。 研 究 发 现 ， 
ASD 者 对 不 同 刺 激 属 性 的 视听 时 间 知 觉 受 任务 类 
型 的 影响 ,如 对 于 非 言语 刺激 ， 该 群体 在 声音 诱 
发 闪光 错 觉 任务 中 表现 出 时 间 窗 宽 的 特点 ， 但 在 
优先 注视 任务 SI 和 TOS 任务 中 却 与 正常 被 试 无 
显著 差异 (Foss-Feig et al., 2010; Bebko et al., 2006; 
Stevenson, Siemann, Schneider et al., 2014)。 这 表 
明 ASD 者 跨 通道 时 序 知觉 和 内 隐 视 听 时 间 加 工 
可 能 存在 不 同 的 加 工 机 制 。 


3 孤独 症 者 视听 时 间 整 合 缺 陷 表 现 


3.1 视听 时 间 整 合 窗口 异常 
视听 整合 过 程 中 , 个 体 的 知觉 能 够 忽略 视听 
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刺激 之 间 可 能 存在 的 时 间 差 ， 把 不 同步 的 刺激 整 
合 为 一 个 有 意义 的 整体 事件 ， 视 听 刺 激 之 间 的 时 
间 间 隔 被 称 为 时 间 窗 (Temporal Binding Window, 
TBW)。 在 该 窗口 内 输入 的 刺激 可 以 被 整合 为 一 个 
整体 ， 当 超出 这 个 时 间 间 隔 时 ， 则 会 被 知觉 为 两 
个 不 同事 件 。 它 反应 了 大 脑 对 视听 刺激 时 间 间 隔 
知觉 敏感 性 的 高 低 ，TBW 越 宽 表明 对 刺激 间 时 间 
差 知觉 的 敏感 性 越 低 。 当 TBW 变 宽 时 , 视听 刺激 
之 间 的 时 间 关 系 会 变 得 模糊 ,该 时 间 范 围 内 输入 
的 刺激 可 能 被 整合 , 但 往往 对 不 同事 件 却 不 能 区 
Sal), 致使 多 种 感觉 的 知觉 表征 减弱 ， 甚 至 出 现 错 
误 整 合 (Stevenson et al., 2016)。 很 多 研究 表明 ， 与 
正常 被 试 相 比 , ASD 者 存在 TBW 宽 的 特点 (Foss- 
Feig et al., 2010; Kwakye et al., 2011; Stevenson, 


Siemann, Schneider et al., 2014; Stevenson, 
Siemann, Woynaroski et al., 2014) (如 图 1)。 


A. 正常 个 体 的 时 间 窗 
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图 1 正常 人 和 ASD 者 的 时 间 窗 结构 
(资料 来 源 : Stevenson et al., 2016) 


B. ASD 个 体 的 时 间 窗 
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首先 , ASD 者 基于 非 言语 刺激 的 TBW 约 为 正 
TAN 2 倍 。 研 究 者 使 用 声音 诱发 闪光 错觉 任 
务 对 46 名 8~17 岁 的 ASD 和 正常 被 试 进行 了 研 
究 。 结 果 发 现 ， 当 SOA 在 300 ms (-150 ~ +150 ms) 
内 时 , 正常 组 报告 两 个 闪光 的 概率 会 提高 ; 而 
ASD 被 试 大 约 在 600 ms (-300 ~ +300 ms) 内 都 会 
提高 。 在 基线 条 件 下 ， 即 呈现 一 个 圆 点 和 一 个 声 
音 时 , 组 间 差 异 不 显著 ， 这 表明 两 组 差异 不 是 和 
反应 偏差 造成 的 ASD 者 的 听觉 会 在 更 长 时 段 内 
干扰 其 视觉 加 工 (Foss-Feig et al., 2010)。 随 后 ， 研 
究 者 直接 检验 了 ASD 者 听觉 对 视觉 时 序 判断 的 
影响 。 该 研究 在 视觉 TOJ 任务 的 基础 上 ， 分 别 在 
两 个 视觉 刺激 之 前 和 之 后 呈现 声音 , 第 一 个 声音 
与 第 一 个 视觉 刺激 同时 呈现 ， 第 二 个 声音 在 第 二 
个 视觉 刺激 出 现 一 个 SOA 后 呈现 。 结 果 发 现 ， 正 
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常 被 试 在 SOA 为 50~150 ms 时 声音 会 促进 视觉 时 
序 判断 ， 而 ASD 被 试 在 0~300 ms 内 时 序 判断 的 
正确 率 都 提高 了 (Kwakye et al., 2011)。 
其 次 ,刺激 类 型 会 影响 TBW 的 宽度 , ASD 者 
基于 言语 刺激 的 TBW BOER Ri, A 
格 克 效 应 的 强度 有 关 。 该 效应 主要 用 于 衡量 视听 
言语 整合 能 力 ， 其 强度 越 强 , 视听 言语 整合 能 力 
越 弱 (Stevenson, Siemann, Schneider et al., 2014; 
Baum et al., 2015)。 一 方面 , 行为 研究 检验 了 ASD 
者 时 间 加 工 与 视听 言语 整合 的 关系 ,研究 中 使 用 
简单 、 复 杂 非 言语 和 言语 三 种 属性 刺激 。 结 果 发 
现 ， 相 比 正常 被 试 , ASD 者 基于 言语 刺激 的 TBW 
更 宽 , 且 该 群体 麦 格 克 效 应 的 强度 从 简单 非 言 语 
刺激 、 复 杂 非 言语 刺激 到 复杂 言语 刺激 逐渐 增强 ， 
而 正常 组 没有 表现 出 这 种 趋势 (Stevenson，Siemann， 
Schneider et al., 2014; Stevenson, Siemann, 
Woynaroski et al., 2014b)。 男 一 方面 ,神经 生理 学 
的 研究 表明 ， 后 侧 杜 上 沟 (Posterior Superior 
Temporal Sulcus, pSTS) 是 视听 时 间 和 言语 整合 的 
重要 神经 机 制 , 在 麦 格 克 效 应 中 有 着 重要 作用 ， 
而 ASD 者 该 脑 区 的 激活 模式 和 正常 被 试 存 在 差 
异 (Hocking & Price, 2008; Stevenson, VanDerKlok, 
Pisoni, & James, 2011; Beauchamp, Nath, & Pasalar, 
2010)。 有 研究 使 用 fMRI 技术 检验 了 ASD 和 正常 
被 试 对 不 同属 性 刺激 在 视听 同步 和 异步 呈现 时 的 
神经 激活 模式 , 结果 显示 ,在 言语 刺激 条 件 下 ， 
当 视 听 同 步 呈现 时 ,正常 被 试 pSTS 区 域 的 激活 
显著 减少 , 而 ASD 者 没有 显著 变化 ; 在 非 言语 刺 
激 条 件 下 ,视听 同步 和 异步 呈现 时 被 试 间 差异 不 
显著 。 这 表明 在 视听 言语 刺激 同步 呈现 时 ，ASD 
者 的 整合 效率 没有 提高 ， 其 与 言语 刺激 有 关 的 神 
经 加 工 机 制 存 在 异常 (Stevenson et al., 2013)。 
再 次 , 言语 阅读 障碍 者 也 表现 出 了 TBW w 
的 特点 , 但 与 ASD 者 有 所 不 同 , 言语 阅读 障碍 者 
在 视觉 和 听觉 时 间 加 工 方面 都 存在 缺陷 ,而 ASD 
者 只 存在 听 党 时 间 加 工 缺 陷 (Laasonen，Service, & 
Virsu, 2001; Hairston, Burdette, Flowers, Wood, & 
Wallace, 2005; Kwakye et al., 2011). 人 研究 发 现 ， 两 
者 的 神经 加 工 模式 不 同 ASD 者 表现 为 局 部 超 联 
结 和 长 距 联 结 不 足 ， 而 言语 阅读 障碍 者 表现 为 近 
距离 联结 不 足 和 末端 联结 过 度 (Rippon，Brock, 
Brown, & Boucher, 2007; Williams & Casanova, 
2010). 
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最 后 ,ASD 者 TBW 的 分 布 结构 更 对 称 。 目 前 ， 
对 于 ASD 者 TBW 的 研究 主要 基于 实验 室 实 验 ， 
视听 刺激 之 间 的 时 间 间 隔 受 人 为 控制 , 通常 AV 
和 VA 两 种 条 件 随 机 呈现 。 然 而 ,由 于 视听 信息 的 
传播 速度 不 同 , 个 体 接收 到 听觉 信息 的 时 间 应 晚 
于 视觉 信息 ， 因 此 TBW 为 左 宽 右 窗 的 不 对 称 分 
布 ,而 ASD 个 体 的 TBW 则 更 对 称 ， 其 分 布 形态 
似 正 常 幼儿 期 (Hillock-Dunn & Wallace，2012; 
Hillock, Powers, & Wallace, 2011). 
3.2 ”快速 视听 时 间 再 校准 能 力 不 足 

快速 视听 时 间 再 校准 (rapid audiovisual temporal 
recalibratiom) 是 大 脑 对 视听 刺激 的 时 间 关 系 再 适 
应 的 结果 ， 当 视听 不 同步 时 ， 可 以 通过 调节 两 者 
间 时 间 关 系 向 延迟 的 方向 偏 移 ， 将 其 整合 为 一 个 
整体 事件 (van der Burg, Alais, & Cass, 2013)。 校准 
能 力 的 强 弱 通常 用 主观 同时 点 (point of subjective 
simultaneity, PSS) 的 偏 移 进 行 衡 量 。PSS 是 指 主观 
上 认为 两 个 刺激 同时 出 现 , 但 实际 却 存 在 一 定 的 
时 间 间 隔 (Noel,De Niear, Stevenson, Alais, & 
Wallace, 2017)。 当 视听 刺激 绝对 同时 呈现 时 , PSS 
应 是 SOA 为 0 时 的 值 , 但 在 进行 再 校准 时 ,PSS 
会 发 生 偏 移 。 其 偏 移 量 越 大 ， 表 明 校 准 能 力 越 强 ， 
即 对 视听 不 同步 的 适应 能 力 越 强 。 相 比 正常 被 试 ， 
ASD 者 的 快速 视听 时 间 再 校准 能 力 不 足 表现 为 不 
能 快速 适应 视听 刺激 的 不 同步 性 ， 且 对 不 同 刺激 
类 型 再 校准 能 力 的 共性 低 (Turi，Karaminis，Pellicano， 
& Burr, 2016; Noel et al., 2017)。 

研究 者 使 用 简单 非 言语 刺激 对 ASD 和 正常 
成 人 的 快速 视听 时 间 再 校准 进行 了 研究 ， 结果 发 
现 ， 当 先 呈 现 听 觉 先 于 视觉 的 试 次 ， 再 呈现 视觉 
先 于 听觉 的 试 次 时 ， 先 前 试 次 会 对 当前 试 次 产生 
影响 。 表 现 为 正常 成 人 的 PSS WE T 53 ms, 而 
ASD 成 人 几乎 没有 发 生 偏 移 (Turi et al., 2016)。 这 
表明 当 视 听 刺 激 不 同步 呈现 时 , 正常 成 人 对 优先 
呈现 通道 时 序 知觉 的 适应 国 限 发 生 了 变化 ， 当 视 
听 刺 激 之 间 的 时 间 间 隔 变 大 时 ， 其 适应 效应 增强 ， 
而 ASD 者 不 受 影 响 。 有 研究 还 考察 了 ASD 青 少 
年 的 快速 视听 时 间 再 校准 与 刺激 属性 的 关系 。 研 
究 中 使 用 了 简单 非 言语 、 复 杂 非 言语 和 言语 三 种 
刺激 。 结 果 表 明 , 在 言语 刺激 条 件 下 , ASD 被 试 的 
再 校准 能 力 与 正常 组 无 差异 , 但 在 简单 和 复杂 非 
言语 刺激 条 件 下 ，ASD 被 试 PSS 的 偏 移 量 显著 少 
于 正常 组 , 简单 非 言 语 条 件 下 两 组 被 试 的 偏 移 量 
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分 别 为 33.15 ms 和 17.96 ms, 复杂 非 言 语 条 件 下 
分 别 为 18.06 ms 和 9.12 ms (Noel et al., 2017)。 

值得 注意 的 是 ， 有 关 正 常 成 人 的 研究 表明 ， 
快速 视听 时 间 再 校准 能 力 与 TBW 存在 正 相 关 ， 
但 在 Noel 等 2017) 的 研究 中 却 没 有 发 现 这 种 相关 
(van der Burg et al., 2013)。 这 可 能 与 年 龄 因素 有 
关 ， 前 者 以 成 人 为 研究 对 象 ， 而 后 者 则 以 青少年 
为 被 试 。 贝 叶 斯 理论 认为 感觉 整合 的 各 个 方面 都 
会 随 着 年 龄 的 变化 而 变化 , 且 正 常人 的 TBW 到 
成 年 期 才 达 到 成 熟 (Lewkowicz & Flom, 2014; 
Hillock-Dunn & Wallace, 2012)。 
3.3 ”听觉 时 间 线 索 对 视觉 搜索 促进 作用 弱 

在 视听 整合 过 程 中 ， 当 视听 刺激 在 一 定 的 时 
间 间 隅 内 呈现 时 ,大 脑 会 协调 视听 通道 的 信息 加 
工 使 其 相互 影响 。 在 此 过 程 中 ,听觉 能 够 依赖 视 
听 刺 激 间 的 时 间 关 联 性 调节 视觉 通道 的 加 工 (Shi， 
Chen, & Müller, 2010)。“Pop-out” 效 应 是 视听 通道 
信息 调节 作用 的 一 种 ， 该 效应 的 发 生 需 要 对 视听 
信息 之 间 的 时 间 关 系 进 行 加 工 (van der Burg et al., 
2008)。 有 学 者 对 14~31 岁 的 ASD 者 和 正常 被 试 
进行 了 人 研究, 研究 中 通过 改变 闪光 数量 设置 了 三 
种 负荷 水 平 , 分 别 为 24、36 和 48。 结 果 发 现 ， 当 
呈现 “pip” 声 音 时 ,正常 被 试 在 所 有 水 平 上 的 反应 
时 和 正确 率 都 显著 提高 , 而 ASD 者 均 没 有 提高 ， 
且 在 没有 声音 条 件 下 ，ASD 被 试 的 反应 时 快 于 正 
常 被 试 (Collignon et al., 2013)。 这 表明 ASD 者 的 
视听 整合 缺陷 可 能 是 由 于 其 不 能 精确 知觉 视听 刺 
激 间 的 时 间 关 系 造成 的 。 

然而 ， 有 研究 却 得 出 了 不 同 的 结论 。de 
Boer-Schellekens 和 Keetels 等 (2013) 使 用 三 种 任务 
进行 了 研究 : 伴随 声音 的 视觉 时 序 判断 任务 、 
“pip-pop” 任 务 、 数 字 表 阅读 任务 。 结 果 发 现 , ASD 
个 体 视觉 时 序 辨别 敏感 性 较 低 ,但 当 呈 现 声音 刺 
TAN, ASD 和 正常 被 试 的 IND 都 显著 降低 ， 即 敏 
感性 提高 了 , 且 ASD 被 试 JND 下 降 的 幅度 大 于 正 
常 被 试 。 这 表明 ASD 个 体 可 以 利用 声音 线索 促进 
视觉 时 序 判 断 。 同样， 在 “pip-pop” 任 务 中 当 呈 现 
声音 时 , 与 正常 被 试 一 样 ， ASD 者 的 视觉 搜索 效 
率 提高 了 , 这 说 明 ASD 个 体能 够 知觉 视听 刺激 的 
时 间 同 步 性 。 

结果 的 争议 可 能 是 由 于 ASD 者 的 注意 缺陷 
造成 的 ， 研 究 发 现 分 散 的 视觉 注意 有 利于 “pip- 
pop” 任 务 中 的 视听 同步 性 知觉 (van der Burg et al., 
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2008)。 在 de Boer-Schellekens 和 Keetels 等 (2013) 
的 研究 中 直接 告诉 被 试 声音 和 靶 刺 激 颜 色 的 变化 
同时 呈现 , 这 使 得 ASD 被 试 可 以 自由 使 用 搜索 策 
略 ， 利 用 自 上 而 下 的 认 知 加 工 促进 视觉 搜索 ， 弥 
补 了 自 下 而 上 的 视听 整合 缺陷 。 而 在 Collignon 等 
(2013) 的 研究 中 则 要 求 被 试 注视 中 心 注视 点 ， 由 
于 ASD 者 弱 中 央 统 合 的 加 工 特点 ,会 强化 其 局 部 
加 工 缺 陷 , 不 利于 促进 视听 信息 的 同步 性 知觉 
(Happé & Frith, 2006)。 
3.4 ”言语 刺激 的 视听 时 序 知 觉 敏 感性 低 

视听 时 序 知觉 是 指 对 两 个 视听 事件 是 否 同时 
出 现 以 及 相继 出 现时 先后 顺序 的 知觉 其 敏感 性 
受 刺 激 属 性 的 影响 , 通常， 对 言语 刺激 时 序 知觉 
的 敏感 性 低 于 非 言 语 刺激 (Vatakis & Spence, 
2006)。 多 数 研究 发 现 , 与 正常 被 试 相 比 ,ASD 者 
的 时 序 辨别 敏感 性 低 ， 且 在 刺激 属性 和 任务 差异 
方面 存在 不 同 (Grossman et al., 2015; de Boer- 
Schellekens, Eussen, et al., 2013)。 

一 方面 ,在 视听 同步 性 知觉 的 研究 中 ，ASD 
者 对 言语 刺激 的 视听 同步 性 辨别 能 力 较 低 。 学 者 
使 用 优先 注视 任务 检验 了 4~6 岁 的 ASD、 正 常 和 
其 它 发 育 障碍 儿童 在 非 言 语 、 简 单 言语 和 复杂 言 
语 刺 激 方面 的 视听 同步 性 辨别 能 力 。 结 果 发 现 ， 
ASD 儿童 基于 非 言 语 刺 激 的 时 间 同 步 性 辨别 与 正 
党 被 试 差异 不 显著 ,而 在 简单 和 复杂 言语 刺激 方 
面 却 显著 低 于 正常 组 (Bebko et al.，2006)。 随 后 ， 
有 研究 使 用 该 任务 进一步 从 内 隐 和 外 显 两 个 角度 
进行 了 探讨 ， 结果 发 现 ， 控 制 组 在 外 显 条 件 下 对 
视听 同步 呈现 视频 注视 的 概率 高 于 内 隐 条 件 ， 而 
ASD 组 在 两 种 条 件 下 差异 不 显著 ， 且 注视 概率 都 
显著 低 于 控制 组 (Grossman et al., 2015)。 男 一 方面 ， 
在 视听 时 序 判 断 任务 中 ,ASD 者 时 序 辨 别 敏 感性 
低 但 不 受 刺激 类 型 的 影响 。 研究 者 探讨 了 ASD 者 
和 正常 青少年 对 不 同 刺 激 属性 的 时 序 知觉 ， 结 
发 现 , ASD 者 的 JND (116.6 ms) 大 于 正常 被 试 (88.1 
ms)， 但 基于 刺激 属性 的 组 间 差 异 不 显著 (de 
Boer-Schellekens, Eussen, et al., 2013). 

综 上 所 述 ASD 者 基于 言语 刺激 的 时 间 同 步 
性 辨别 存在 缺陷 。 一 种 可 能 是 由 于 该 群体 对 言语 
事件 之 间 的 时 间 同 步 性 尚未 建立 ; 另 一 种 可 能 是 
实验 中 试 次 呈现 的 时 间 太 短 ， 其 辨别 能 力 弱 致 使 
没有 觉察 到 视听 刺激 的 同步 性 。 此 外 , ASD 者 对 
非 言 语 刺激 的 时 序 知 觉 表 现 出 了 任务 差异 ， 这 可 


1036 心理 科学 进展 第 26 卷 


能 是 由 于 研究 中 SOA 取 值 的 不 同 造成 的 。 如 
Bebko 等 (2006) 的 研究 中 SOA 为 3 s, 而 de Boer- 
Schellekens 和 Eussen 等 (2013) 的 研究 中 则 为 40 ~ 
320 ms. 


4 视听 时 间 整 合 缺 陷 的 理论 解释 


4.1 时 间 绑 定 缺 陷 假说 
时 间 绑 定 缺 陷 假 说 (the temporal binding 
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但 其 听觉 时 间 加 工 敏感 性 显著 低 于 正常 组 (Kwakye 
et al., 2011)。 有 关 事 件 相关 电位 的 研究 表明 , ASD 
者 在 无 噪音 背景 下 对 听觉 刺激 的 反应 与 控制 组 在 
噪音 背景 下 的 反应 结果 一 样 ， 这 表明 其 在 基线 
水 平 下 对 听觉 刺激 的 反应 减弱 (Russo，Zecker, 
Trommer, Chen, & Kraus, 2009)。 该 假说 从 神经 机 
制 角度 对 ASD 者 TBW 宽 的 特点 进行 了 解释 , 但 
与 时 间 绑 定 缺 陷 假 说 有 所 不 同 。 前 者 认为 ASD 者 


deficit hypothesis) 认 为 ,ASD 者 的 时 间 加 工 缺 陷 是 
由 于 其 神经 激活 的 时 间 异 常 造成 的 ， 主 要 表现 为 
大 脑 的 神经 放电 在 时 间 上 和 缺乏 可 靠 性 ， 如 过 度 超 
同步 化 放电 、 神 经 元 突 发 性 异常 放电 等 (Brock, 
Brown, Boucher, & Rippon, 2002)。 其 假设 的 前 提 
是 , 大 脑 是 通过 特征 绑 定 进行 信息 加 工 的 。 在 视 
听 整 合 过 程 中 ， 分 散 于 不 同 皮 层 的 信息 组 合 的 关 
键 是 不 同 特征 神经 激活 之 间 的 时 间 关 系 。 当 一 簇 
视听 信息 流 在 相近 的 时 间 内 输入 时 , 会 激活 大 量 
神经 元 , 这 些 神经 激活 之 间 的 时 间 关 系 发 生产 乱 
会 造成 知觉 绑 定 缺陷 。 例 如 ， 有 研究 发 现 ,ASD 者 
可 以 整合 视听 刺激 , 但 所 需 加 工时 间 更 长 ,表现 
出 TBW 宽 的 特点 (Foss-Feig et al., 2010; Kwakye 
et al., 2011)。 这 是 由 于 其 局 部 神经 网 络 之 间 的 时 
间 绑 定 可 以 进行 但 功能 较 弱 ， 而 局 部 神经 网 络 内 
的 时 间 绑 定 是 完好 其 至 高 于 正常 被 试 的 。 该 假说 
是 目前 解释 ASD 者 视听 时 间 加 工 缺 陷 较 核心 的 
理论 ,但 由 于 其 提出 时 间 较 早 ,， 在 有 关 特 征 捆绑 
的 信息 加 工 模式 、 时 间 绑 定理 论 的 有 效 性 、 对 复 
杂 刺 激 绑 定 模式 的 解释 及 y 波 同步 性 激活 等 方面 
还 存在 不 足 (Brock et al., 2002)。 
4.2 ” 信 噪 比 减少 假说 

信 噪 比 减 少 假说 (decreased signal-to-noise 
ratio hypothesis) 认 为 ，ASD 者 神经 编码 的 信 噪 比 
较 低 ,， 神 经 系统 自发 放电 干扰 和 反应 变异 性 较 大 ， 
导致 其 稳定 性 差 而 减弱 了 信息 提取 能 力 。 视 听信 
息 在 一 定 的 时 间 范 围 内 呈现 时 会 相互 影响 ， 当 单 
通道 神经 激活 的 时 间 变 异 增 大 时 , 会 干扰 双 通 道 
的 整合 加 工 (Rubenstein & Merzenich, 2003; Dinstein 
et al., 2012)。 通常 ， 当 呈现 一 个 单 通 道 刺激 时 ， 刺 
激 出 现 的 瞬间 便 会 激活 与 之 相关 的 神经 , 但 ASD 
者 对 两 者 之 间 时 间 精 确 性 的 知觉 较 弱 。 例 如 ， 有 
关 人 研究 探讨 了 单 通道 时 间 加 工 异 常 是 否 会 造成 
ASD 者 的 视听 时 间 整 合 缺 陷 。 结 果 发 现 ， 与 正常 
被 试 相 比 ， 在 视觉 时 间 加 工 方面 没有 显著 差异 ， 


主要 是 神经 网 络 之 间 的 时 间 加 工 存在 异常 ， 而 局 
部 网 络 内 的 加 工 是 完好 的 ; 后 者 则 强调 是 单 通道 
的 时 间 加 工 异 常 引起 了 双 通 道 整 合 缺 陷 。 
4.3 ” 贝 叶 斯 理论 

该 理论 认为 ,知觉 是 感觉 刺激 与 内 部 表征 最 
优 匹配 的 结果 , ASD 者 在 进行 信息 加 工时 过 度 依 
赖 当前 感觉 信息 ， 而 忽略 先前 经 验 (Pellicano & 
Burr, 2012)。 在 进行 视听 时 间 再 校准 时 , 个 体 需 要 
合理 优化 内 部 表征 和 实际 感觉 信号 之 间 不 同步 的 
时 间 关 系 ， 最 小 化 同一 事件 感觉 线索 之 间 的 差异 ， 
促进 视听 整合 。 对 正常 人 而 言 ， 当 两 者 之 间 存 在 
差异 时 , 个 体会 灵活 调整 这 种 不 符 , 但 由 于 ASD 
者 感觉 线索 权重 的 增加 ， 其 内 在 期 望 和 实际 感觉 
言 号 之 间 的 不 符 会 减少 ,使 得 再 校准 能 力 减弱 。 
内 在 表征 和 感觉 噪音 期 望 分 布 之 间 的 强度 差异 是 
两 者 之 间 不 符 的 主要 因素 , 这 种 差异 会 随 着 刺激 
复杂 性 的 不 同 而 变化 ,例如 ,研究 发 现 , ASD 者 对 
言语 刺激 的 快速 视听 时 间 再 校准 与 正常 组 无 差异 ， 
而 对 非 言语 刺激 的 再 校准 能 力 显 著 减 弱 (Turi et 
al., 2016; Noel et al., 2017)。 这 是 由 于 , 与 言语 刺 
激 相 比 ， 低 水 平 刺激 的 感觉 噪音 更 小 。 当 呈现 同 
样 的 感觉 信号 时 ，ASD 者 对 低 水 平 刺激 内 部 表征 
的 噪音 减少 , 误差 信号 减弱 ， 而 不 能 进行 再 校准 。 
但 言语 刺激 因 其 内 部 表征 的 噪音 较 大 , 使 得 ASD 
组 和 控制 组 都 可 以 进行 。 该 理论 解释 了 先前 经 验 
在 视听 时 间 整 合 中 的 作用 , 但 主要 针对 ASD 者 的 
快速 视听 时 间 再 校准 缺陷 , 且 目 前 该 方面 的 实证 
研究 主要 集中 于 即时 的 快速 再 校准 ， 很 少 涉及 建 
立 在 长 时 适应 基础 上 的 再 校准 。 
4.4 预测 编码 假说 

预测 编码 假说 (predictive coding hypothesis) 
认为 ， 多 感觉 整合 包括 视听 信息 同时 输入 、 与 内 
部 表征 匹配 、 作 出 辨别 或 反应 三 个 过 程 。 在 此 过 
程 中 , 视听 刺激 会 依据 彼此 之 间 的 时 间 关 系 相互 
影响 ,， 阁 视觉 通道 先 完成 加 工 , 便 会 为 听觉 信息 
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加 工 提供 可 靠 的 线索 ,进而 提高 加 工效 率 。 如 当 
发 出 声音 “ba" 时 ， 既 可 以 利用 听觉 线索 知觉 ， 也 


Chinaxiv 合 作 期 刊 
括 用 于 外 显 时 序 知觉 研究 的 SJ、TOJ、 优 先 注视 
任务 以 及 基于 内 隐 时 间 加 工 研究 的 声音 诱发 闪光 


可 通过 视觉 线索 知觉 ， 如 果 先 激活 听觉 通道 ， 它 
就 会 促进 视觉 加 工 (Altieri, 2014)。 由 于 ASD 个 体 
环境 信息 的 统计 理解 能 力 较 弱 ,不 能 对 视听 刺 
激 之 间 的 时 间 关 系 进行 精准 把 握 。 因 此 ， 当 视听 
刺激 的 阅 限 都 在 一 定 的 时 间 内 激活 时 ， 其 信息 加 
工 是 彼此 独立 的 ， 听觉 不 能 对 视觉 产生 影响 
(Pellicano & Burr, 2012)。 例 如 ,在 “pop-out" 效 应 中 ， 
ASD 者 不 能 利用 听觉 线索 促进 视觉 加 工 ， 致 使 视 
觉 搜索 效率 没有 提高 (Collignon et al., 2013)。 该 理 
论 从 神经 计算 角度 解释 了 ASD 者 的 内 隐 时 间 加 
工 缺 陷 , 但 目前 的 实证 研究 还 很 少 ， 且 大 都 是 从 
间接 角度 进行 验证 ， 还 需要 直接 证 据 的 支撑 。 

综 上 所 述 ， 目 前 的 理论 从 神经 机 制 的 异常 激 
活 模 式 和 认 知 加 工 差异 的 层面 对 ASD 者 的 视听 
时 间 整 合 缺 陷 进 行 了 解释 ， 得 到 了 一 些 行为 研究 
的 支持 ， 但 相关 的 神经 生理 学 研究 还 很 少 。 此 外 ， 
视听 时 间 整 合 不 仅 是 对 刺激 间 物 理 时 间 量 的 加 工 
还 涉及 心理 时 间 量 加 工 ， 其 整合 过 程 中 的 神经 激 
活 存在 时 间 进 程 , ASD 者 和 正常 被 试 的 激活 规律 
是 否 相 同 ,目前 的 理论 还 难以 解释 。 未 来 需 加 强 
相关 的 神经 机 制 研究 ， 可 以 构建 视听 时 间 整 合 加 
工 的 理论 模型 ， 并 对 行为 数据 加 以 验证 ,例如 ,在 
有 关 视 听 言 语 整 合 的 研究 中 ,学 者 使 用 神经 生理 
学 技术 构建 了 视听 言语 整合 的 神经 加 工 模型 ， 在 
正常 被 试 群体 中 建立 常 模 ， 比 较 其 与 ASD 者 的 加 
工 差 异 。 结 果 发 现 ，ASD 者 视听 言语 整合 缺陷 不 
是 由 于 其 突 触 连接 和 可 塑性 弱 ， 而 是 注意 和 多 感 
党 加 工 缺 陷 导 致 的 Cuppini et al., 2017). 


5 小结 与 展望 


视听 时 间 整 合 探讨 了 视听 整合 中 的 时 间 加 工 
机 制 。ASD 者 的 相关 研究 发 现 了 其 在 视听 整合 的 
时 间 窗 口 、 跨 通道 刺激 的 时 序 辨 别 、 内 隐 时 间 线 
索 加 工 等 方面 存在 缺陷 。 研 究 中 使 用 方法 多 样 ， 
但 主要 集中 于 行为 层面 ,关注 的 焦点 是 其 TBW 
异常 ， 并 通过 使 用 不 同 刺 激 类 型 研究 其 与 视听 言 
语 加 工 的 关系 。 相 关 理 论 从 神经 加 工 机 制 、 先 前 
经 验 作 用 和 多 感觉 加 工 过 程 等 角度 解释 了 其 缺 
陷 。 不 过 ， 该 领域 仍 存在 一 些 问题 吸 待 研究 。 

5.1 提高 研究 生态 效 度 
ASD 者 视听 时 间 整 合 的 研究 方法 目前 主要 包 
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错觉 和 “pip-pop” 任 务 , 但 这 些 方法 还 存在 不 足 。 
首先 ， 进一步 分 离 内 隐 研 究 中 的 注意 因素 和 时 间 
加 工 机 制 。 在 视听 整合 的 研究 中 , 声音 的 呈现 会 
影响 视觉 加 工 ， 当 视听 刺激 同时 呈现 时 会 产生 整 
合 效应 , 但 当 声 音 先 于 视觉 刺激 如 提前 200 ms Æ 
现时 ， 视 觉 加 工效 率 的 提高 可 能 是 由 于 声音 引起 
的 警觉 作用 而 非 整 合 (de Boer-Schellekens, Keetels, 
Eussen, & Vroomen, 2013)。 因此 ASD 者 视听 整合 
缺陷 是 由 于 其 不 能 精确 知觉 跨 通道 刺激 间 的 时 间 
线索 , 还 是 注意 缺陷 造成 的 ， 两 者 加 工 机 制 的 相 
互 作用 值得 深入 探讨 。 其 次 , 改进 研究 方法 以 提 
高 对 被 试 的 适用 性 。ASD 是 一 组 谱系 障碍 ， 包 括 
很 多 亚 型 ,症状 差异 和 个 体 差 异 极 大 。 目 前 的 任 
务 各 具 针 对 性 ， 如 SJ、TOJ、“pip-pop” 及 声音 诱 
发 闪光 错觉 任务 主要 适用 于 高 功能 ASD 被 试 , 其 
至 有 些 高 功能 ASD 者 也 无 法 完成 ， 而 优先 注视 任 
务 主要 用 于 幼儿 的 研究 。 未 来 需 简 化 研究 任务 ， 
进一步 开发 适用 于 低 功能 及 不 同 亚 型 被 试 的 任务 。 
5.2 ”整合 理论 解释 

目前 对 ASD 者 视听 时 间 整 合 缺 陷 的 理论 解 
释 还 缺乏 普 适 性 ， 如 时 间 绑 定 缺 陷 假 说 和 信和 噪 上 
减少 假说 主要 用 于 解释 其 TBW 宽 缺 陷 、 贝 叶 斯 
理论 主要 对 快速 视听 时 间 再 校准 不 足 进行 了 解 
释 、 预 测 编码 理论 解释 了 其 内 隐 时 间 加 工 缺 陷 。 
但 视听 时 间 整 合 是 一 个 动态 的 整体 加 工 过 程 ， 可 
能 存在 多 种 加 工 方式 。 例 如 ， 有 研究 提出 正常 人 
对 视听 刺激 的 同步 性 知觉 存在 4 种 加 工 模式 : 大 
脑 可 以 直接 忽略 视听 刺激 间 的 时 间 差 ;中枢 神经 
可 以 对 时 间 延 迟 的 刺激 进行 补偿 加 工 ; 个 体会 灵 
活 调整 视听 刺激 的 不 同时 性 使 其 差异 最 小 化 进而 
促进 整合 ; 对 一 个 通道 刺激 的 时 间 知 觉 会 向 另 一 
个 通道 偏 移 (Vroomen & Keetels, 2010)。 因 此 ， 有 
必要 进一步 整合 相关 研究 , 提出 较 全 面 、 系 统 的 
理论 解释 。 
5.3 ”精确 量化 诊断 指标 

时 间 窗 、 主 观 同时 点 和 最 小 可 觉 差 是 目前 衡 
量 视听 时 间 整 合 的 重要 指标 。 它 们 都 可 以 进行 精 
确 量化 , 但 要 作为 ASD 者 视听 时 间 整 合 缺陷 的 诊 
断 依据 还 需 谨 慎 。 首 先 , 重视 TBW 宽度 的 量化 。 
正常 人 的 TBW 一 般 为 300 ms， 而 研究 发 现 ASD 
者 为 600 ms (Foss-Feig et al., 2010)。 但 由 于 研究 
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中 使 用 任务 的 差异 、 被 试 反 应 偏差 的 影响 、 刺 激 
材料 选取 的 不 同 以 及 统计 标准 差异 等 因素 ,不 同 
人 研究 中 对 TBW 的 计算 还 不 够 精确 统一 (Stevenson 
& Wallace, 2013)， 如 果 未 来 可 以 证 实 其 跨 任务 、 
跨 年 龄 等 的 一 致 性 ， 这 将 会 为 ASD 的 诊断 提供 重 
要 依据 ; 其 次 , 综合 使 用 三 者 。 除了 TBW 宽度 的 
量化 , 正常 人 适应 视听 刺激 的 时 间 差 后 PSS 的 偏 
移 量 表现 为 先 增 大 后 减 小 的 趋势 ， 峰 值 出 现在 刺 
PAGES 100~200 ms 左右 ， 且 不 同 个 体 时 间 知 觉 的 
IND 也 存在 差异 (Vroomen, Keetels, De Gelder, & 
Bertelson, 2004; Fujisaki, Shimojo, Kashino, & 
Nishida, 2004; Stevenson, Zemtsov, et al., 2012). Ñ 
来 可 以 结合 这 三 个 指标 , 提高 诊断 依据 的 可 靠 性 。 
54 ”开发 有 效 干 预 策略 
对 ASD 者 视听 时 间 整 合 的 干预 不 仅 可 以 提 
高 其 时 间 知 觉 能 力 , 促进 视听 整合 ,还 可 以 进 一 
步 改 善 其 言语 知觉 和 社交 缺陷 。 目前 对 ASD 者 视 
听 时 间 整 合 的 干预 研究 还 比较 少 ， 而 正常 人 已 在 
行为 和 神经 机 制 方面 形成 了 两 类 较 系 统 的 干预 模 
式 : 一 种 是 自 下 而 上 再 校准 (bottom-up recalibration 
through exposure)， 即 通过 从 简单 到 复杂 的 任务 训 
练 逐 步 提 高 视听 时 间 知 觉 敏感 性 ; 另 一 种 是 自 上 
而 下 的 反馈 训练 (top-down feedback training)， 即 
通过 反馈 不 断 调整 对 视听 刺激 的 时 间 知 觉 (Fujisaki 
et al., 2004; Powers, Hillock, & Wallace, 2009; 
Powers, Hevey, & Wallace, 2012)。 干 预 中 主要 使 用 
觉 学 习 任 务 ， 这 种 任务 简单 、 易 操作 ， 可 以 适用 
F ASD 被 坛 。 此 外 ,电子 游戏 经 验 可 以 促进 个 体 
的 时 序 知觉 ， 研 究 表明 ， 电 子 游 戏 经 验 丰 富 的 个 
体 在 SJ 和 TOJ 任 务 中 视听 时 序 辨 别 的 敏感 性 更 高 
(Donohue, Woldorff, & Mitroff, 2010). 未 来 可 以 借 
助 多 媒体 技术 对 知觉 学 习 任 务 进行 改进 ， 开 发 适 
IF ASD 者 的 干预 策略 ， 这 种 干预 方式 不 仅 
趣 、 可 操作 性 强 , 可 以 让 被 试 在 娱乐 中 提升 视听 
时 间 知 觉 能 力 ， 还 能 够 根据 被 试 的 年 龄 特征 和 功 
能 症状 提出 有 针对 性 的 干预 方案 。 
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Audiovisual temporal integration in autism spectrum disorders 
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HE Jianging’; LI Chenyang'; LIU Shuqing” 
( Department of Psychology, Liaoning Normal University, Dalian 116029, China) 
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Abstract: Audiovisual temporal integration is the fact that the relative timing of audio-visual stimulation 
should be bound into a unified percept. The audiovisual temporal integration of autism spectrum disorders 
(ASD) was confirmed to be impaired mainly in four aspects. First, the temporal binding window is wider 
and more symmetrical. Second, ASD got weaker ability of rapid audiovisual temporal recalibration. Third, 
the effect that visual target search can be improved by a synchronous sound decreased has been found to be 
missing in ASD in some studies. Last, ASD showed impaired audiovisual temporal acuity for speech stimuli. 
Various methods are used to probe for temporal aspects of audiovisual integration, such as sound-induced 
flash illusion task and "pip-pop" task. The simultaneity judgment task, temporal order judgment task and 
preferential-looking task are mainly used to measure intersensory synchrony. Relevant theories from 
abnormal neural processing, the internal priors and the interaction between multiple sensory modals explain 
those defects. In future, researchers should improve the ecological validity of study, further integrate 
different theoretical explanations and accurate quantitative diagnostic indicators, as well as exploit the 
effective intervention strategies. 

Key words: autism spectrum disorders; audiovisual temporal integration; temporal binding window; temporal 


synchrony 


